首先先說明一下,四個黃金信號皆是以衡量請求(request)為基準,也就是說,每當使用者對網路服務送出一個請求,並等待回應時,會遇到的狀況。
而這裡特別指名「對使用者來說有感的指標」,實際上產品本身除了對這些對Site的相關監控外,也應對Sever進行各種監控。
即服務請求所需的時間,監控目的是希望使用者可等待如預期的時間並獲得回應。
除了統計處理Request的時間,還要區分成功請求的延遲時間和失敗請求的延遲時間,主要是為了避免在追溯或計算問題時可能會有誤導。最好的情境是可以知道,平常穩定時,Latency時間應落在哪個區間,而出現明顯latency變長時,就會更好地被監控到
衡量對系統的需求量,監控目的是為了確保不會因為一次過多人湧入而造成系統癱瘓。
對於 Web 服務,通常會統計QPS。也就是每秒 HTTP 請求數,,當然也可以根據請求的性質(例如,靜態內容與動態內容)進行細分。
Request失敗的比率,監控目的是希望確保使用者可以獲得正確的回應及資訊。
無論是顯性(HTTP 500)、隱性(HTTP 200 表示成功,但卻提供錯誤內容),都應該被如實紀錄。通常公司會自定義一些標準已要求錯誤率必須低於幾%以表達自己的平台穩定度,而平常只會統計HTTP 500的請求,但透過End to End 的系統性測試才能檢測隱性的Error(正在提供錯誤的內容)。
即系統資源的使用率,監控目的是確保產品的核心服務是正常運行的。
Ex: CPU、資料I/O、記憶體使用程度等等。正常來說,我們會設定一個使用率的上限(Ex: 80%),超過這個比例即會自動跳出Alert來提醒目前的系統狀況可能相對不健康。抑或是某個服務斷線,亦可以在這裡挑出Alert來呼叫相關人員來處理。
以上的信號不只適用於一般網站或to C的產品,to B的服務亦相當適用!好啦,這麼大篇章的說明完了Google的滿滿乾貨,希望各位或多或少有些收穫..有嗎???
我們前面規劃了產品策略、建構了產品品質的衡量方法,下一步,便是進到了客戶管理的層面了。想管理客戶,那麼得要先有客戶吧!下一篇我們來聊聊:Welcome Onboard1: 讓用戶第一次使用就上手